Spark Datasource V2

V1局限

  • 依赖上层API,如SQLContext和DataFrame
  • 内部的数据列表达没有直接应用,增加连接器中的数据转换工作
  • 外部数据源无法像内部数据源一样传递分区信息给引擎
  • 数据写接口不支持事务
  • 仅支持过滤和列裁剪下推

参考资料